Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:
|
|
- Søren Kai Knutsen
- 6 år siden
- Visninger:
Transkript
1 Punktestimator STK00 - Bootstrapping og simulering - Kap 7 og eget notat Geir Storvik 8. april 206 Trekke ut informasjon om parametre fra data x,..., x n Parameter av interesse: θ Punktestimator: Observator, funksjon av data som kan brukes til å estimere θ Punktestimat: Verdi av estimator når observasjonsverdier settes inn. ål på kvalitet: SE(ˆθ) = E[(ˆθ θ) 2 ] SE(ˆθ) = V (ˆθ) + }{{} (E(ˆθ) θ) 2 }{{} Varians (Forventningsskjevhet) 2 Ønskelig å rapportere både forventningsskjevhet og varians. Kan noen ganger regne ut fra antagelser om fordeling til X Alternativ : Asymptotiske tilnærminger Alternativ 2: Bruke simuleringer - bootstrapping X i, i =,..., n er levetidene til n komponenter Anta X i Exp(λ), E(X i ) = /λ Estimator: ˆλ = /X, Estimat: / = Varians til ˆλ: Variasjonen i ˆλ ved gjentatte eksperimenter der vi samler inn n = 0 observasjoner i hvert eksperiment. ulig metode for å finne varians: Repetere eksperiment mange ganger Problem: Vanskelig å repetere eksperiment i praksis. Løsning: Simulere eksperiment på datamaskin ATLAB : n = 0; B = 000; mu = / lambda ; for b=:b xstar = exprnd (mu,,n ) ; lambdasim (b) = /mean( xstar ) ; SE=sqrt ( var ( lambdasim ) ) Problem: å kjenne λ! Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ: x = [ ] ; n = 0; mu_hat = mean( x ) lambda_hat = / mu_hat B = 000; lambdasim = zeros (,B ) ; for b=:b x s t a r = exprnd ( mu_hat,, n ) ; lambdasim (b) = /mean( xstar ) ; SE = sqrt ( var ( lambdasim ) ) 5 kjøringer av disse komandoene gir standard feil verdiene En økning av B til 0000 ga tallene To kilder til usikkerhet: Usikkerhet i de opprinnelige observasjoner x,..., x n Usikkerhet i våre simuleringer I praksis: Usikkerhet i simuleringer svært små
2 Parametrisk Bootstrapping - generell idé Ikke-parametrisk Bootstrapping Anta X,..., X n F (x; θ), observert x,..., x n Estimer F (x; θ) med F(x; ˆθ) der ˆθ er estimat på θ basert på x,..., x n.. Repeter for b =,..., B. Simuler x,..., x n fra F (x; ˆθ).2 Sett θ b = ˆθ(x ) der x = (x,..., x n ) 2. Estimer σ ˆθ ved B B b= (θ b θ ) 2 der θ = B B b= θ b. Vi kaller dette Parametrisk bootstrapping da vi bruker den parametriske formen på F (x; θ). Anta X,..., X n F (x), vet ingenting om F (x). F(x) = P(X x) = E[I(X x)]. ulig estimat: F (x) = Antall x i x n = n (#x i x) = n n I(x i x) F(x) diskret sannsynlighetsfordeling med P(X = xi ) = n for i =,..., n. Svarer til å trekke fra {x,..., x n} med tilbakelegging i= - Ikke-parametrisk Bootsrapping Kunne vi brukt sentralgrenseteoremet? Parametrisk Bootstrapping - Ikke parametrisk Bootstrapping Observasjoner ATLAB kode: x = [ ] ; n = 0; B = 000; lambdasim = zeros (,B ) ; for b=:b x s t a r = randsample ( x, n, t r u e ) ; lambdasim (b) = /mean( xstar ) ; SE = sqrt ( var ( lambdasim ) ) ˆλ = /X: 5 gjentatte kjøringer av disse kommandoene ga standard feil Standardfeil har økt noe. ˆµ = X ˆλ = /X ikke gjennomsnitt, sentralgrenseteoremet kan ikke brukes ˆµ = X er et gjennomsnitt, men n = 0 litt lite.
3 Forventningsskjevhet Vi har Bias(ˆθ) = E[ˆθ] θ Fra data: Estimat på θ, ˆθ = ˆθ(x,..., x n ) Fra Bootstrap simuleringer: ˆθ = ˆθ(x,..., x n ), simulert med antagelse om at ˆθ er sann parameter. Bootstrap estimat: Bias(ˆθ) = θ ˆθ b i a s = mean( lambdasim) lambdahat Parametrisk bootstrapping: Bias(ˆθ) = Ikke-parametrisk bootstrapping: Bias(ˆθ) = Bootstrapping Estimat SE Bias Parametrisk Ikke-parametrisk Parametrisk Bootstrap: SE = = [ ] 0 5 = Ikke-par Bootstrap: SE = = [ ] 0 4 = Stokastisk simulering og onte Carlo integrasjon Bootstrapping: Simulering et verktøy for å få ut de svar vi ønsket Hvordan kan en datamaskin utføre simuleringer fra en vilkårlig fordeling? Hva annet kan vi bruke stokastisk simulering til? Simulering fra en vilkårlig fordeling datamaskinen en deterministisk boks få datamaskinen til å simulere hva vi kaller pseudotilfeldige tall dvs de tall vi får ut ligner på den fordeling vi er ute etter. Utgangspunktet for all stokastisk simulering er simulering av variable fra den uniforme fordeling på intervallet [0, ]. ATLAB : u = rand ( ) ; x = 0:0.025: n = h i s t c ( u, x ) ; bar ( x, n / ( sum( n ) ), ) ;
4 Inversjonsmetoden Ønsker nå å simulere fra en generell fordeling med kumulativ fordelingsfunksjon F. La U uniform[0, ] La X = F (U). Da er P(X x) =P(F (U) x) =P(U F (x)) = F(x) - eksponensiell fordeling Ønsker å trekke fra den eksponensielle fordeling f (x; λ) = λe λx. Da er F(x; λ) = e λx F (u) = λ log( u). Algoritme:. Generer u Uniform[0, ]. 2. Sett x = λ log( u) I ATLAB med λ =.5 kan flere variable genereres simultant ved kommandoene lambda =. 5 ; u = rand (,0000); x = log( u ) / lambda ; som viser at X da har kumulativ fordelingsfunksjon F. Kunne brukt direkte exprnd her - Cauchy fordeling Forkastningsmetoden Cauchy fordelingen er definert ved f (x) = π(+x 2 ) F(x) = 2 + π tan (x) F (u) = tan[π(u 2 )] ATLAB kommandoer: u = rand (,0000); x = tan ( pi ( u 0.5)) Anta nå vi ønsker å simulere fra en fordeling f (x) = 20x( x) 3, 0 < x < Spesialtilfelle av Beta fordelingen som er en mye brukt fordeling for observasjoner som er begrenset til intervallet [0, ]. Den kumulative fordelingsfunksjonen F (x) har ikke noe analytisk uttrykk Forkastningsmetoden: Anta en forslagsfordeling g(x) slik at f (x)/g(x) < c for alle x. algoritme:. Simuler y g( ). 2. Generer u Uniform[0, ] 3. Hvis u f (x)/(cg(x)), sett x = y, hvis ikke returner til trinn Proposisjon: X f (x) Sannsynligheten for å akseptere en generert y er /c Bevis: Oppgave 5.85 i Devore & Berk (202)
5 Valg av c Krav: f (x)/g(x) < c for alle x. c er et mål på hvor effektiv algoritmen er, P(Akseptere) = /c. Vanlig valg: c = min x f (x) g(x) erk: å ha g(x) > 0 for alle verdier der f (x) > 0. Anta igjen f (x) = 20x( x) 3, 0 < x < Forslag: g(x) = 0 < x <, uniform fordeling c = min x f (x) g(x) = min x 20x( x) 3 = 20 4 ( 4 )3 = 35/64 Algoritme: n = 0000; x = zeros (, n ) ; cinv = 64/35; for i =:n y = rand ( ) ; u = rand ( ) ; while ( u > 20 y ( y) ( y) ( y ) cinv ) y = rand ( ) ; u = rand ( ) ; x ( i ) = y ; onte Carlo integrasjon onte Carlo integrasjon - eksempel Anta av interesse: θ = cos(x)e x 2 /2 dx Kan omskrive integralet til θ = = 2π cos(x) 2π e x 2 /2 dx 2π cos(x)f (x)dx der f (x) nå er sannsynlighetstetthetsfunksjonen til standard normal fordelingen. Gir θ = E[ 2π cos(x)] der X N(0, ) Estimator: θ = i= 2π cos(xi ) der X,..., X m N(0, ) θ = i= 2π cos(xi ) ATLAB : = 0000; x = normrnd (0,,,) ; y = sqrt (2 pi ) cos ( x ) t h e t a h a t = mean( y ) ; Fem kjøringer av disse kommandoene ga verdiene Numerisk integrasjon: = ga
6 Egenskaper C integrasjon Kvantifisering av usikkerhet Har også θ = i= Y i der Y i = 2π cos(x i ) V ( θ) = V (Y i), σ θ = σ Yi Kan estimere V (Y i ) ved s 2 Y = i= (y i y) 2. : s cos(xi ) =.204 og ˆσ θ = P( θ 2σ θ θ θ + 2σ θ) =P( 2σ θ θ θ 2σ θ) Sentralgrenseteoremet P( 2 θ θ σ θ =P( 2 θ θ σ θ =P( 2 θ θ σ θ 2) 2). 2) P( 2 Z 2) = Φ(2) Φ( 2) = som gir P( θ 2σ θ θ θ + 2σ θ) : [ θ 2σ θ, θ + 2σ θ)] = [.599,.523] dekke den sanne verdi av θ med sannsynlighet 95.4% onte Carlo metoden Av interesse: θ = g(x)dx = g(x) f (x) f (x)dx krever at f (x) > 0 hvis g(x) > 0 Anta f (x) er en sannsynlighetstetthetsfunksjon. Da er ) θ = E ( g(x) f (X) der X f (x). Anta X,..., X n f (x), Y i = g(x i ) f (X i ). Estimator: θ = i= Egenskaper: E( θ) =θ Y i V ( θ) = V (Y ) σ θ = σ Y Av interesse: θ = 2 π(+x 2 ) dx La f (x) = (Cauchy fordeling) π(+x 2 ) θ = P(X 2) X,..., X n f (x). ˆθ = S i= Y i cauchyrnd.m og C_cauchy.m erk: Kan velge både og f (x).
Bootstrapping og simulering Tilleggslitteratur for STK1100
Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor
DetaljerBootstrapping og simulering
Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk, men
DetaljerBootstrapping og stokatisk simulering Tilleggslitteratur for STK1100
Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100 Geir Storvik April 014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerSTK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerModeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x
STK1100 - Puktestimerig - Kap 7 Geir Storvik Modeller og parametre Biomisk fordelig ( ) p X (x) = p x (1 p) x x Parameter: p Normalfordelig f X (x) = 1 2πσ e 1 2σ 2 (x µ) 2 11. april 2016 Parametre: µ,
DetaljerNotat 3 - ST februar 2005
Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk
DetaljerEkstraoppgaver for STK2120
Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0
DetaljerObservatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter
Observatorer STK00 - Observatorer - Kap 6 Geir Storvik 4. april 206 Så langt: Sannsynlighetsteori Stokastiske modeller Nå: Data Knytte data til stokastiske modeller Utgangspunkt Eksempel høyde Oxford studenter
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerFørste sett med obligatoriske oppgaver i STK1110 høsten 2015
Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Dette er det første obligatoriske oppgavesettet i STK1110 høsten 2015. Oppgavesettet består av fire oppgaver. Du må bruke Matematisk institutts
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,
DetaljerStatistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)
TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,
DetaljerEkstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014
Ekstreme bølger Geir Storvik Matematisk institutt, Universitetet i Oslo 5. mars 2014 Bølger Timesvise max-bølger ved bøye utenfor østkyst av USA (17/12/1991-23/2-1992) Størrelse på bølger varierer sterkt
DetaljerEstimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU
Estimatorar Torstein Fjeldstad Institutt for matematiske fag, NTNU 11.10.2018 I dag Repetisjon Er dataa mine normalfordelt? Estimatorar Eigenskapar til S 2 Kahoot 2 Repetisjon Obervator Ein observator
DetaljerLøsningsforslag oblig 1 STK1110 høsten 2014
Løsningsforslag oblig STK høsten 4 Oppgave I forbindelse med en studie av antioksidanter og antocyanider, ble innholdet av antocyan i 5 beger med blåbær målt. De målte verdiene var (i mg per gram): 55
DetaljerTMA4240 Statistikk Høst 2015
TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe
DetaljerHøgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen
Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerUtfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerOblig 1 i MAT2400. Oppgave 1. Tor Hedin Brønner. a) Vi tar integralet av f X (x) fra til x: = 1. Medianen, µ, finner vi ved å sette.
Oblig 1 i MAT24 Tor Hedin Brønner Oppgave 1. a) Vi tar integralet av f X (x) fra til x: x f X (x) dy = Medianen, µ, finner vi ved å sette.5 = µ dy + x = [ θ y θ] x = θ x θ + θ θ ( θ = 1 x) µ θ = θ.5 µ
DetaljerUtvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerKapittel 2: Hendelser
Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en
DetaljerForelesning 27. mars, 2017
Forelesning 27. mars, 2017 AVSNITT 5.5 Ordningsobservatorene AVSNITT 6.1 Observatorer og deres fordelinger Ordningsobservatorene La X 1,..., X n være n uavhengige stokastiske variable som alle har samme
Detaljerx λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 7 Løsningsskisse Oppgave 1 a) Regner først ut den kumulative fordelingsfunksjonen til X: F X (x) = x λe λt dt
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 30. november 1992. Tid for eksamen: 09.00 15.00.
DetaljerKap. 6.1: Fordelingen til en observator og stok. simulering
Kap. 6.1: Fordelingen til en observator og stok. simulering Data, observatorer og relaterte fordelinger. Stokastisk simulering. Illustrasjon: - Sammenligning av jury bedømmelser i idrett. Fra data til
DetaljerDekkes av kap , 9.10, 9.12 og forelesingsnotatene.
Estimering 2 -Konfidensintervall Dekkes av kap. 9.4-9.5, 9.10, 9.12 og forelesingsnotatene. En (punkt-)estimator ˆΘ gir oss et anslag på en ukjent parameterverdi, men gir oss ikke noen direkte informasjon
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerKapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering
Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerHypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:
Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.
DetaljerFasit til eksamen i emnet MAT102 - Brukerkurs i matematikk II Mandag 21.september 2015
Fasit til eksamen i emnet MAT02 - Brukerkurs i matematikk II Mandag 2.september 205 Fasit. (a) Løs ligningssystemene. i) 5x + 7y = 4 3x + 2y = ii) 3x + 4y + z = 2 2x + 3y + 3z = 7 Svar: i) x = 85/, y =
DetaljerTMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerBernoulli forsøksrekke og binomisk fordeling
Bernoulli forsøksrekke og binomisk fordeling Bernoulli forsøksrekke i) gjentar et forsøk n ganger ii) hvert forsøk gir enten suksess eller fiasko iii) sannsynligheten for suksess er p i alle forsøkene
DetaljerTMA4240 Statistikk H2017 [15]
TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]
DetaljerProgrammering i R - del 2
Programmering i R - del 2 14. februar 2004 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Deleksamen i: STK Sannsynlighetsregning og statistisk modellering Eksamensdag: Mandag 4. mars 26 Tid for eksamen: 5. 7. Oppgavesettet er
Detaljerfor x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerTMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag
TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum
DetaljerObservatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU
Observatorar og utvalsfordeling Torstein Fjeldstad Institutt for matematiske fag, NTNU 08.10.2018 I dag Til no i emnet Observatorar Utvalsfordelingar Sentralgrenseteoremet 2 Til no i emnet definisjon av
DetaljerMedisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
DetaljerSiden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.
Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen
DetaljerST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren
ST0103 Brukerkurs i statistikk Høsten 2016 Momentestimatoren og sannsynlighetsmaksimeringsestimatoren (SME) Boka har bare ett eksempel med sannsynlighetsmaksimeringsestimatoren. Vi gjengir dette nedenfor,
DetaljerLøsningsforslag øving 8, ST1301
Løsningsforslag øving 8, ST3 Oppgave Hva gjør følgende funksjon? Hvilken fordeling har variabelen n som returneres som funksjonsverdi? Forklar hvorfor. Forutsett at to enkle positive tall blir oppgitt
DetaljerEKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER Lørdag 16. august 2003 Tid: 09:00 14:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side av 6 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38/73 94 27 25 EKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER
DetaljerOm eksamen. Never, never, never give up!
I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.
DetaljerOppfriskning av blokk 1 i TMA4240
Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerForelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind
Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator
DetaljerFasit eksamen i MAT102 4/6 2014
Fasit eksamen i MAT /6. (a Løs ligningssstemene. Svar: i ( x i = 3x + = 7 x + = ( 6, ii x z ii = x + z = 3x + 6 + z = +. er fri. (b Ved å bruke MATLAB-kommandoen rref på totalmatrisen til ligningssstemet
DetaljerOm eksamen. Never, never, never give up!
Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve
DetaljerFerdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2
Besvar alle oppgavene. Hver deloppgave har lik vekt. Oppgave I En kommune skal bygge ny idrettshall og vurderer to entreprenører, A og B. Begge gir samme pristilbud, men kommunen er bekymret for forsinkelser.
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerTMA4240 Statistikk Høst 2009
TMA44 Statistikk Høst 9 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b Løsningsskisse Oppgave X er en stokastisk variabel med sannsynlighetstetthet { f(x),
DetaljerBootstrapping Tilleggslitteratur for STK2100
Bootstrapping Tilleggslitteratur for STK2100 Geir Storvik Februar 2018 1 Introduksjon Dette notatet er et supplement til STK2100. Læreboka (James et al., 2013) diskuterer bootstrapping men går ikke så
DetaljerUtvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel
DetaljerSTK Statistiske metoder og dataanalyse høsten 2019 Løsningsforslag til oppgaver i læreboka for uke 38
STK1110 - Statistiske metoder og dataanalyse høsten 2019 Løsningsforslag til oppgaver i læreboka for uke 38 Vinnie Ko & Ørnulf Borgan September 21, 2019 Lærebok: Modern Mathematical Statistics with Applications
DetaljerTMA4245 Statistikk Høst 2016
TMA5 Statistikk Høst 6 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving Løsningsskisse Oppgave a) Den tilfeldige variabelen X er kontinuerlig fordelt med sannsynlighetstetthet
DetaljerKontinuerlige sannsynlighetsfordelinger.
Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x er sannsynlighetstettheten til en kontinuerlig X dersom:. f(x 0 for alle x R 2. f(xdx = 3. P (a
DetaljerØvingsforelesning i Matlab TDT4105
Øvingsforelesning i Matlab TDT4105 Øving 6. Tema: funksjoner med vektorer, plotting, while Benjamin A. Bjørnseth 12. oktober 2015 2 Oversikt Funksjoner av vektorer Gjennomgang av øving 5 Plotting Preallokering
DetaljerGammafordelingen og χ 2 -fordelingen
Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 16. november 2009) 1. Sannsynlighet La A, B, A 1, A 2,...,B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerSTK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner
STK1100 våren 2017 Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner Svarer til avsnittene 4.1 og 4.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i
DetaljerSTK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger
STK00 våren 206 Normalfordelingen Svarer til avsnitt 4.3 i læreboka Geir Storvik Matematisk institutt Universitetet i Oslo Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger Normalfordelingen
DetaljerTMA4240 Statistikk H2015
TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
DetaljerRidge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S 2 Mette Langaas Foreleses onsdag 13.oktober, 2010 2 Estimering Mål: finne sannheten
DetaljerEksamensoppgave i ST0103 Brukerkurs i statistikk
Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00
DetaljerMAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag
MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag I kapittel 9 i kompendiet forklarte vi at maximum-likelihood er en av de viktige anvendelsene av ikke-lineær optimering. Vi skal se litt mer på hva
DetaljerTMA4240 Statistikk Høst 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave X er kontinuerlig fordelt med sannsynlighetstetthet f X (x) = { x exp( x ) x
DetaljerForeleses onsdag 13.oktober, 2010
TMA440 Statistikk H010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S Mette Langaas Foreleses onsdag 13.oktober, 010 Estimering Mål: finne sannheten om
DetaljerL12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider
Page 76 of 80 L12-Dataanalyse Introduksjon Introduksjon til dataanalyse Presentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF,, osv) i modeller vi benytter for vedlikeholdsoptimering
DetaljerTilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9
3 Tilfeldig utvalg [8.1] DEF 8.1: En populasjon er mengden av observasjoner som vi ønsker å studere, dvs. alle observasjoner det er mulig å gjøre. (Dersom elementene i populasjonen har fordeling f(x),
DetaljerDiskrete sannsynlighetsfordelinger.
Diskrete sannsynlighetsfordelinger. Dekkes av kapittel 5 i læreboka. Husk: f(x) er punktsannsynligheten til en diskret X dersom: 1. f(x) 0 2. x f(x) =1 3. f(x) =P (X = x) Vi skal nå sepå situasjoner der
DetaljerMer om Markov modeller
Høyere ordens Markov modeller Mer om Markov modeller p h mnr = Pr( Y j+ 3 = ah Y j+ 2 = am, Y j+ 1 = an, Y j = a : r For en k-te ordens Markov modell som modellerer en DNA prosess vil det være 3*4 k mulige
DetaljerTo-dimensjonale kontinuerlige fordelinger
To-dimensjonale kontinuerlige fordelinger Noen resultater for diskrete fordelinger Vi har tidligere definert punktsannsynligheten p(x, y) for en todimensjonal variabel (X, Y ) som p(x, y) = P ({X = x}
DetaljerEksamensoppgåve i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerEKSAMEN I TMA4245 Statistikk
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Turid Follestad (98 06 68 80/73 59 35 37) Hugo Hammer (45 21 01 84/73 59 77 74) Eirik
DetaljerUtvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.
Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg
DetaljerKapittel 4.4: Forventning og varians til stokastiske variable
Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske
DetaljerUNIVERSITETET I OSLO ØKONOMISK INSTITUTT
Eksamen: ECON2130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 29.05.2019 Sensur kunngjøres: 19.06.2019 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:
DetaljerKap. 8: Utvalsfordelingar og databeskrivelse
Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling
DetaljerForelesning 3. april, 2017
Forelesning 3. april, 2017 APPENDIX TIL KAP. 6 Sentralgrenseteoremet AVSNITT 6.3 Anvendelser av sentralgrenseteoremet Histogrammer S-kurver Q-Q-plot Diverse eksempler MGF for følger av uavhengige identisk
Detaljer(utarbeidet av Mette Langaas), TMA4245 V2007
Kapittel 8 og 9 Ett- og toutvalgs estimering; statistisk inferens, forventningsretthet, punktestimat, intervallestimat og prediksjonsintervall, estimere forventningsverdi, differanse, andel og varians,
DetaljerDEL 1 GRUNNLEGGENDE STATISTIKK
INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................
DetaljerTMA4240 Statistikk Høst 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 8, blokk II Løsningsskisse Oppgave 1 Da komponentene danner et parallellsystem, vil systemet fungere dersom minst
DetaljerEKSAMEN I FAG TMA4275 LEVETIDSANALYSE
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist 975 89 418 EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Fredag 26. mai 2006
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 9.6: Prediksjonsintervall 9.8: To utvalg, differanse µ 1 µ 2 Mette Langaas Foreleses mandag 18.oktober, 2010 2 Prediksjonsintervall for fremtidig observasjon,
DetaljerFasit MAT102 juni 2016
Fasit MAT02 juni 206. (a) Finn egenverdiene og egenvektorene til matrisen ( ) 6 A = 2 7 Svar: λ = 8 og ( ) x = y y ( ) /2, λ = 5 og ( ) x = y y ( ) for alle y 0. (b) Finn den generelle løsningen på systemet
Detaljer